Model Selection

End-to-end speech recognition

# End-to-end speech recognition

Faster Whisper Base.en

This is a Whisper base.en model converted based on CTranslate2, used for English speech recognition tasks.

Speech Recognition English

Assignment1 Joane

A speech-to-text (S2T) model for automatic speech recognition (ASR)

Speech Recognition

Transformers English

Classroom-workshop

Assignment1 Jack

A speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture

Speech Recognition

Transformers English

Classroom-workshop

Assignment1 Jane

s2t-small-librispeech-asr is a speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture.

Speech Recognition

Transformers English

Classroom-workshop

S2t Medium Librispeech Asr

A speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture

Speech Recognition

Transformers English

S2t Small Librispeech Asr

A speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture

Speech Recognition

Transformers English

Wav2vec2 Marathi Stt

This is a Marathi speech recognition model based on the Wav2Vec2 architecture, capable of directly converting speech to text.

Speech Recognition

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

This is an automatic speech recognition (ASR) pretrained model based on the ESPnet2 framework, trained on the mini-an4 dataset and supports English speech recognition.

Speech Recognition English

Asr Wav2vec2 Commonvoice Rw

This is an end-to-end model for automatic speech recognition in Rwandan, based on the wav2vec 2.0 pre-trained model combined with CTC and attention mechanisms, fine-tuned on the CommonVoice dataset.

Speech Recognition Other

S2t Large Librispeech Asr

An end-to-end sequence-to-sequence transformer model for automatic speech recognition (ASR), trained on the LibriSpeech dataset

Speech Recognition

Transformers English

Wav2vec2 Base Turkish Cv8

This is an automatic speech recognition (ASR) model fine-tuned on the Common Voice 8.0 Turkish dataset, capable of converting Turkish speech into text.

Speech Recognition

Transformers Other

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase